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BLAST Basic Local Alignment Search Tool 



Blast 2 sequences 
gb|Af011751| (9599 letters) 

Results for: IgbjAFO1 1751 .1 Hepatitis C mvs strain H77 pCV-H77C polyprotein gene omplete :ds(95 bp) 
Your BLAST job specified more than one input sequence. This box lets you choose which input sequence to show 
BLAST results for. 

Query ID 

gi|2327070|gb|AF01 1 751 .1 |AF01 1 751 
Description 

Hepatitis C virus strain H77 pCV-H77C polyprotein gene, complete cds 
Molecule type 

nucleic acid 
Query Length 

9599 



Subject ID 

gi|5420376|emb|AJ238799.1 1 
Description 

Hepatitis C virus type 1b complete genome, isolate Com 
Molecule type 

nucleic acid 
Subject Length 

9605 
Program 

BLASTN 2.2.21+ Citation 



Zheng Zhang, Scott Schwartz, Lukas Wagner, and Webb Miller (2000), "A greedy algorithm for aligning DNA 
sequences", J Comput Biol 2000; 7(1-2):203-14. 
Other reports: Search Summary i Taxonomy report] 



Search Parameters 



Program blastn 

Word size 28 

Expect value 10 

Hitlistsize 100 
Match/Mismatch scores 1,-2 

Gapcosts 0,0 

Low Complexity Filter Yes 

Filter string L;m; 

Genetic Code 1 



Karlin-Altschul statistics 

Params Ungapped Gapped 
Lambda 1.33271 1.28 



http://blast.ncbi.nlm.nih.gov/Blast.cgi 



9/10/2009 



NCBI Blast:gb|Af011751| (9599 letters) 



Page 2 of 17 



K 
H 



0.620991 
1.12409 



0.46 
0.85 



Results Statistics 



Effective search space 91 853047 



Distribution of 2 Blast Hits on the Query Sequence 



[21 



An overview of the database sequences aligned to the query sequence is shown. The score of each alignment is 
indicated by one of five different colors, which divides the range of scores into five groups. Multiple alignments on the 
same database sequence are connected by a striped line. Mousing over a hit sequence causes the definition and score 
to be shown in the window at the top, clicking on a hit sequence takes the user to the associated alignments. New: This 
graphic is an overview of database sequences aligned to the query sequence. Alignments are color-coded by score, 
within one of five score ranges. Multiple alignments on the same database sequence are connected by a dashed line. 
Mousing over an alignment shows the alignment definition and score in the box at the top. Clicking an alignment 
displays the alignment detail. 



Color key for alignment scores 




0 



1500 



3000 



4500 



6000 



7500 



9000 



http://blast.ncbi.nlm.nih.gov/Blast.cgi 



9/10/2009 



NCBI Blast:gb|Af011751| (9599 letters) 



Page 3 of 17 



V 



Plot of gi|2327070|gb|AF011751.1|AF011751 vs gi|5420376|emb|AJ238799.1| [?] 



This dot matrix view shows regions of similarity based upon the BLAST results. The query sequence is represented on 
the X-axis and the numbers represent the bases/residues of the query. The subject is represented on the Y-axis and 
again the numbers represent the bases/residues of the subject. Alignments are shown in the plot as lines. Plus strand 
and protein matches are slanted from the bottom left to the upper right corner, minus strand matches are slanted from 
the upper left to the lower right. The number of lines shown in the plot is the same as the number of alignments found by 
BLAST. 



Sequences producing significant alignments: 

(Click headers to sort columns) 

AJ2387 99.1 Hepatitis" c" virus "type "lb "complete" genome, isolate' "5956 9311 99% 0."0 79% 
Conl 




Legend for links to other resources: ID UniGene O GEO E3 Gene Structure El Map Viewer 
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Alignments Select AIK ''-uvNO ;>e 3 ;nces l-c sec j NEW 



>emb|AJ238799.1| 

Length=9605 



Hepatitis C virus type lb complete genome, isolate Conl 



Sort alignments for this subject se 
E value Score Percent identity 
Query start position Subject sta 



Score = 5956 bits (3225), Expect = 0.0 
Identities = 7350/9298 (79%), Gaps = 458/9298 (4%) 
Strand=Plus/Plus 

Query 531 CCTATCCCCAAGGCACGTCGGCCCGAGGGCAGGACCTGGGCTCAGCCCGGGTACCCTTGG 59 0 

I I I I I I I I I I I I I I II I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I III 
Sbjct 531 CCTATCCCCAAGGCTCGCCAGCCCGAGGGTAGGGCCTGGGCTCAGCCCGGGTACCCCTGG 59 0 

Query 591 CCCCTCTATGGCAATGAGGG-TTGCGGGTGGGCGGGATGGCTCCTGTCTCCCCGTGGCTC 6 49 

I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sbjct 591 CCCCTCTATGGCAATGAGGGCTTG-GGGTGGGCAGGATGGCTCCTGTCACCCCGTGGCTC 6 49 

Query 650 TCGGCCTAGCTGGGGCCCCACAGACCCCCGGCGTAGGTCGCGCAATTTGGGTAAGGTCAT 709 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sbjct 650 TCGGCCTAGTTGGGGCCCCACGGACCCCCGGCGTAGGTCGCGCAATTTGGGTAAGGTCAT 709 

Query 710 CGATACCCTTACGTGCGGCTTCGCCGACCTCATGGGGTACATACCGCTCGTCGGCGCCCC 769 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sbjct 710 CGATACCCTCACGTGCGGCTTCGCCGATCTCATGGGGTACATTCCGCTCGTCGGCGCCCC 769 

Query 770 TCTTGGAGGCGCTGCCAGGGCCCTGGCGCATGGCGTCCGGGTTCTGGAAGACGGCGTGAA 829 

II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
Sbjct 770 CCTAGGGGGCGCTGCCAGGGCCCTGGCGCATGGCGTCCGGGTTCTGGAGGACGGCGTGAA 829 

Query 83 0 CTATGCAACAGGGAACCTTCCTGGTTGCT-CTTTCTCTATCTTCCTTCTGGCCCTGCTCT 888 

I I I I I I I I I I I I I I I II II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
Sbjct 83 0 CTATGCAACAGGGAATCTGCCCGGTTGCTCCTTT-TCTATCTTCCTTTTGGCTTTGCTGT 888 

Query 8 89 CTTGCCTGACTGTGCCC-GCTTCAGCCTACCAAGTGCGCAA — T-TCCTCGGGGCTTTAC 9 44 

III I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Sbjct 8 89 CCTGTTTGACCAT-CCCAGCTTCCGCTTATGAAGTGCGCAACGTAT-C-CGGAG-TGTAC 9 44 

Query 9 45 CATGTCACCAATGATTGC-CCTAACTCGAGTATTGTGTACGAGGCGGCCG — ATGCCATC 1001 

I I I I I I I I II II III II III I II I I I I I I I I I I I I I II I III III 
Sbjct 9 45 CATGTCAC GAACGACTGCTCC-AACGCAAGCATTGTGTATGAGGCAGCGGACATG — ATC 1001 

Query 10 02 CTGCACACTCCGGGGTGTGT-CCCTTGCGTTCGCGAGGGTAACGCCTCGAGGTGTTGGGT 106 0 

I I I I II II I I I I I II III I I I I I I I I III III I I I I I II I I I I I 
Sbjct 10 02 ATGCATACCCCCGGGTGCGTGCCC-TGCGTTCGGGAGAACAACTCCTCCCGCTGCTGGGT 106 0 

Query 1061 GGCGGTGACCCCCACGGTGGCCACCAGGGACGGCAAAC-TCCCCACAACGCA-GCTTCGA 1118 

III I II I I I I I I I II I I I I I II II I I I I I I I I I III I I I III 
Sbjct 1061 AGCGCTCACTCCCACGCTCGCGGCCAGGAAC-GCTAGCGTCCCCACTACG-ACGATACGA 1118 

Query 1119 CGTCATATCGATCTGCTTGTCGGGAGC-GCCACCCTCTGCTCGGCCCTCTACGTGGGGGA 1177 

II III I I I I I I I I I II III II II I I I I I I I I I II I I I I I I I I I II 
Sbjct 1119 CGCCATGTCGATTTGCTCGTTGGG-GCGGCTGCTCTCTGCTCCGCTATGTACGTGGGAGA 1177 
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Query 


1178 


Sbjct 


1178 


Query 


1236 


Sbjct 


1236 


Query 


1293 


Sbjct 


1293 


Query 


1353 


Sbjct 


1353 


Query 


1413 


Sbjct 


1413 


Query 


1472 


Sbjct 


1472 


Query 


1531 


Sbjct 


1530 


Query 


1586 


Sbjct 


1586 


Query 


1646 


Sbjct 


1646 


Query 


1704 


Sbjct 


1704 


Query 


1762 


Sbjct 


1762 


Query 


1816 


Sbjct 


1816 


Query 


1875 


Sbjct 


1874 


Query 


1932 


Sbjct 


1931 


Query 


1989 


Sbjct 


1989 


Query 


2045 


Sbjct 


2045 


Query 


2103 


Sbjct 


2103 


Query 


2161 


Sbjct 


2161 


Query 


2220 


Sbjct 


2220 



CCTGTGCGGGTCTGTCTTT-CTTGTTGGTCAACTGTTTACCTTCTCTCC-CAGGCGCCAC 1235 

II I I I I I I I I I I III II II I II I I I I I I I I I I I I I II I I II III 
TCTCTGCGGATCTGT-TTTCCTCGTCGCCCAGCTGTTCACCTTCTCGCCTC-GCCGGCAC 1235 

TGGACGAC-G — CAAGACTGCAATTGTTCTATCTATCCCGGCCATATAACGGGTCATCGC 12 92 

II III I II I I I I I I I I I II II II I I I I I I I I I I I I II I I I I I II 

— GA-GACAGTACAGGACTGCAATTGCTCAATATATCCCGGCCACGTGACAGGTCACCGT 12 92 

ATGGCATGGGATATGATGATGAACTGGTCCCCTACGGCAGCGTTGGTGGTAGCTCAGCTG 1352 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I 

ATGGCTTGGGATATGATGATGAACTGGTCACCTACAGCAGCCCTAGTGGTATCGCAGTTA 1352 

CTCCGGATCCCACAAGCCATCATGGACATGATCGCTGGTGCTCACTGGGGAGTCCTGGCG 1412 
I I I I I I I I I I I I I I I I I II I I I I III I II II II II I I I I I I I I I I I III 

CTCCGGATCCCACAAGCTGTCGTGGATATGGTGGCGGGGGCCCATTGGGGAGTCCTAGCG 1412 

GGCATAGCGTA-TTTCTCCATGGTGGGGAACTGGGCGAAGGTCCTGGTAGTGCTGCTGCT 14 71 
III I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I III I III I I I I II 

GGCC TTGCC TACT AT -TCCATGGTGGGGAACTGGGCTAAGGTTCTGATTGTGATGC TACT 14 71 

ATTTGCCGGCGTCGACGCGGAAACCCACGTCACCGGGGGAAATGCCGGCC-GCACCACGG 153 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 

CTTTGCCGGCGTTGACGGGGGAACCTATGTGACAGGGGG-GACGATGGCCAAAAACAC-C 152 9 

CT-GGGCTTGTTGGT — CTCCTTACACCAGGCGCCA-AGCAGAACATCCAAC-TGATCAA 15 85 
I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CTCGGG-AT-TACGTCCCTCTTTTCACCCGG-GTCATCCCAGAAAATCCAGCTTG-TAAA 15 85 

CACCAACGGCAGTTGGCACATCAATAGCACGGCCTTGAATTGCAATGAAAGCCTTAACAC 16 45 
I I I I I I I I I I I I I I I I I I I I I I I II II III I I I I I I I I I I I I III I I I I I 

CACCAACGGCAGCTGGCACATCAACAGGACTGCCCTGAACTGCAATGACTCCCTCAACAC 16 45 

-CGGCTGGTTAGCAGGGCTCTTCTATC-AACACAAATTCAACTCTTCAGGCTGTCCTGAG 17 03 

III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TGGGTTCCTT-GCTGCGCTGTTCTA-CGTGCACAAGTTCAACTCATCTGGATGCCCAGAG 17 03 

AGGTTGGCCAGCTGCCGACGCC-T-TACCGATTTTGCCCAGGGCTGGGGTCCTATCAGTT 1761 

I I I I I I I I I I I I I I I I I III II I I I I I I I I I I I I I I I I I I I I 

CGCATGGCCAGCTGCAG-CCCCATCGA-CGCGTTCGCTCAGGGGTGGGGGCCCATCACTT 1761 

ATGCCAACG-G — A-AGCGGCCTC-GACGA-ACGCCCCTACTGCTGGCACTACCCTCCAA 1815 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

A CAATGAGTCACA-CAG-CTCGGACCAGA-GGCCTTATTGTTGGCACTACGCACCCC 1815 

GACCTTGTGGCATTGTGCCCGCAAAG-AGCGTGTGTGGCCCGGTATATTGCTTCACTCCC 18 7 4 
I II II II II II I I I I I I II I I I I I I I I II II II I I I I I I I I III 

GGCCGTGCGGTATCGTACCCGCGGCGCAG-GTGTGTGGTCCAGTGTACTGCTTCAC-CCC 18 73 

-AGCCCCGTGGTGGTGGGAACGACCGACAGG-TCGGGCG-CGCCTACCTACAGCTGGGGT 1931 

I I I I I II I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I 

AAGCCCTGTCGTGGTGGGGACGACCGACCGGTTC-GGCGTC-CCTACGTACAGTTGGGG- 193 0 

GCA-AATGATACGGATGT-CTTCGTCCTTAACAACAC-CAGGCCACCGCTGGGCAATTGG 19 8 8 

I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I III 
GGAGAATGAGACGGACGTGCTGC-TTCTTAACAACACGC-GGCCGCCGCAAGGCAACTGG 19 8 8 

TTCGGTTGTACCTGGATGAACTCA — ACTGGATTCACCAAAG-TGTGC-GGAGCGCCCCC 2 0 4 4 

II II I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I II II I I I I I 
TTTGGCTGTACATGGATGAA-T-AGCACTGGGTTCACC-AAGACGTGCGGGGGC-CCCCC 2 0 4 4 

TTGTGTCATCGGAGGGG-TGGGCAACAACACCTTG-CTCTGCCCCACTGATTGCTTCCGC 2102 

III I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I 
GTGTAACATCGG-GGGGATCGGCAATAAAACCTTGAC-CTGCCCCACGGACTGCTTCCGG 2102 

AAACATCCGGAAGCCACATACTCTC-GGTGCGGCTCCGGTCCCTGGATT-ACACCCAGGT 216 0 
II II II II I I I I I III I I III II II II II III II I I I I I I I I I 

AAGCACCCCGAGGCCACTTACAC-CAAGTGTGGTTCGGGGCCTTGG-TTGACACCCAGAT 216 0 

GCATGGTCGACTACCCGTATAGGCTTTGGCACTATCCTTGTACCATCAA-TTACACCATA 2 219 
II I I I I I I I I I I I I II I I I I I I I I I I I I I I II II II I I I I II I I I I I 

GCTTGGTCCACTACCCATACAGGCTTTGGCACTACCCCTGCACTGTCAACTT-TACCATC 2 219 

TTCAAAGTCAGGATGTACGTGGGAGGG-GTCGAGCACAGGCTGGAAGCGGCCTGCAACTG 2 2 7 8 
I I I I I II I I I I I I I I I I I I I I III II I I I I I I I I I I I I I I I I II I I I I I II 

TTCAAGGTTAGGATGTACGTGGG-GGGAGTGGAGCACAGGCTCGAAGCCGCATGCAATTG 22 78 
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Query 


2279 


Sbjct 


2279 


Query 


2339 


Sbjct 


2339 


Query 


2397 


Sbjct 


2397 


Query 


2457 


Sbjct 


2457 


Query 


2514 


Sbjct 


2514 


Query 


2573 


Sbjct 


2573 


Query 


2633 


Sbjct 


2633 


Query 


2689 


Sbjct 


2689 


Query 


2746 


Sbjct 


2746 


Query 


2803 


Sbjct 


2803 


Query 


2857 


Sbjct 


2857 


Query 


2912 


Sbjct 


2912 


Query 


2972 


Sbjct 


2972 


Query 


3027 


Sbjct 


3028 


Query 


3085 


Sbjct 


3085 


Query 


3142 


Sbjct 


3142 


Query 


3200 


Sbjct 


3200 


Query 


3259 


Sbjct 


3259 


Query 


3318 


Sbjct 


3318 



GACGCGGGGCGAACGCTGTGATCTGGAAGACAGGGACAGGTCCGAGCTCAGCCCGTTGCT 233 8 
III II II II II III I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 

GACTCGAGGAGAGCGTTGTAACCTGGAGGACAGGGACAGATCAGAGCTTAGCCCGCTGCT 233 8 

GCTGTCCACCACACAGTGGCAGGTCCTT-CCGTGTTCTTTCACGACCCTGCCAGCCT-TG 2396 
I I I I I I II II I I I I I I I I I I II II I I I I I I I I I I I I I I I II I II II 

GCTGTCTACAACGGAGTGGCAGGT-ATTGCCCTGTTCCTTCACCACCCTACC-GGCTCTG 2396 

TCCACCGGCCTCATCCACCTCCACCAGAACATTGTGGACGTGCAGTACTTGTACGGGGTA 2 456 
I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I II III I I I I I I I II 

TCCACTGGTTTGATCCATCTCCATCAGAACGTCGTGGACGTACAATACCTGTACGGTATA 2 456 

GGGTCAAGC-ATCG-CGTCCTGGGCCATTAAGTGGGAGTACGTCGT-TCTCCTGTTCCTT 2 513 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GGGTC-GGCGGTTGTC-TCCTTTGCAATCAAATGGGAGTATGTCCTGT-TGCTCTTCCTT 2 513 

CTGCTTGCAGACGCGCGCGTCTGCT-CCTGCTTGTGGATGATGTTACTCATATCCCAAGC 2 5 72 

II II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II III I I I I I I 
CTTCTGGCGGACGCGCGCGTCTG-TGCCTGCTTGTGGATGATGCTGCTGATAGCTCAAGC 2 5 72 

GGAGGCGGCTTTGGAGAACCTCGTAATACTCAATGCAGCATCCCTGGCCGGGACGCACGG 2 632 

I I I I I II I I I I I I I I I II I I I II I II I I I I I I I I I I I I I I I I I I II 

TGAGGCCGCCCTAGAGAACCTGGTGGTCCTCAACGCGGCATCCGTGGCCGGGGCGCATGG 2 632 

TC-TTGTGTCCTTCCTCGTGTTCTTCTGCT-TTGCGTGGTATC-TGAAGGGTAGG-TGGG 26 8 8 

I II I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I III I II 

-CATTCTCTCCTTCCTCGTGTTCTTCTG-TGCTGCCTGGTA-CATCAAGGGCAGGCT-GG 26 8 8 

TGCCC-GGAGCGGTC-TACGCCCTCTACGG-GATGTGGCCTCTCCTCCTGCTCCTGCTGG 2 7 45 
I III II I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 

T-CCCTGGGGCGG-CATATGCCCTCTACGGCG-TATGGCCGCTACTCCTGCTCCTGCTGG 2 7 45 

CGTTGCC-TCAGCGGGCATACG-CACTGGACAC-GGAGGTGGCCGCGTCGTGTGGCGGCG 2 8 02 

I I I I II II II I I I I I I I II I I I I I I I I I I I I I I II I I I I I II I I I I 
CGTTACCACCA-CGAGCATACGCCA-TGGAC-CGGGAGATGGCAGCATCGTGCGGAGGCG 2 8 02 

TTGTTCTT-GTCGGGT-TAATGGCGC-TGA-CTCTGTCGCCATATTACAAGC-GCTAT-A 2 856 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CGGTT-TTCGT-AGGTCTGAT-ACTCTTGACCT-TGTCACCGCACTATAAGCTG-T-TCC 2 856 

TCAGCT-GG-TGCATGTGGTGGCTT-CAGTATTTTCTGACCAGAGTAGAAGCGCA-AC-T 2911 

II III II I III I I I I I I II II I I I I I I I I I I I I I I II III II I 
TC-GCTAGGCT-CATATGGTGG-TTACAATATTTTATCACCAGGGCCG-AG-GCACACTT 2911 

GCACGTGTGGGTTcccccccTCAACGTCC«q<?aOTCfC{CGCGATGCCGTCATCTTACTCAT 29 71 

III I I I I I I I I I I I I I I I I I I I I I I i 'MM i i ' I I I I I I I I I I I I I I I I I I I I 
GCAAGTGTGGATCCCCCCCCTCAACGTTCGGGGGGGCCGCGATGCCGTCATCCTCCTCAC 2 9 71 

GTGTGTAG-TACACCC-GACCCTGGTATTTGA-CATCACCAAACTAC-TCCTGGCCAT-C 3 02 6 
I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I 

GTGCG-CGATCCACCCAGA-GCTAATCTTT-ACCATCACCAAAAT-CTTGCTCGCCATAC 3 02 7 

TTCGGACCCCT-TTGGATTCTTCAAGCCAGT-TTGCTTAAAGTCCCCTACTTCGTGCGCG 3 0 8 4 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 

-TCGGTCCACTCATGG-TGCTCCAGGCTGGTATAAC-CAAAGTGCCGTACTTCGTGCGCG 3 0 8 4 

TTCAAGGCCTTC-TCCGGAT-C-TGCGCGCTAGCGCGGAAGATAGCCGGAGGTCATTACG 3141 

II II I II I I I I I III III I I I I I I I I I II II I I I I I I I I I 
CACACGGGC-TCATTC-G-TGCATGCATGCTGGTGCGGAAGGTTGCTGGGGGTCATTATG 3141 

TGCAAATGGC-CATCATCAAGTTAGG-GGCGCTTACTGGCACCTATGTGTATAACCATCT 3199 
I I I I I I I I I I I I I I I I I I I II II II II II II II II III I I I I I I I 

TCCAAATGGCTC-TCATGAAGTT-GGCCGCACTGACAGGTACGTACGTTTATGACCATCT 3199 

CACCCCTCTTCGAGACTGGGCGCACAAC-GGCCTGCGAGATCTGGCCGTGGCTGTGGAAC 32 5 8 
I I I I I I II II I I I I I I I I III I I I I I I I I I I I II II I I I I I II II I 

CACCCCACTGCGGGACTGGGCCCAC-GCGGGCCTACGAGACCTTGCGGTGGCAGTTGAGC 32 5 8 

CAGTCGTCTTCTCCCGA-ATGGAGACCAAGCTCATCACGTGGGGGGCAGATACCGCCGCG 3317 

I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I III 
CCGTCGTCTTCT-CTGATATGGAGACCAAGGTTATCACCTGGGGGGCAGACACCGCGGCG 3317 

TGCGGTGACATCATCAACGGCTTGCCCGTCTCTGCCCGTAGGGGCCA-GGAGATAC-TGC 33 75 

II II I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TGTGGGGACATCATCTTGGGCCTGCCCGTCTCCGCCCGCAGGGG-GAGGGAGATACAT-C 33 75 
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Query 


3376 


Sbjct 


3376 


Query 


3434 


Sbjct 


3434 


Query 


3494 


Sbjct 


3494 


Query 


3553 


Sbjct 


3553 


Query 


3613 


Sbjct 


3613 


Query 


3672 


Sbjct 


3672 


Query 


3732 


Sbjct 


3732 


Query 


3792 


Sbjct 


3792 


Query 


3851 


Sbjct 


3851 


Query 


3909 


Sbjct 


3909 


Query 


3966 


Sbjct 


3966 


Query 


4025 


Sbjct 


4025 


Query 


4083 


Sbjct 


4084 


Query 


4141 


Sbjct 


4141 


Query 


4201 


Sbjct 


4201 


Query 


4260 


Sbjct 


4260 


Query 


4318 


Sbjct 


4318 


Query 


4378 


Sbjct 


4378 


Query 


4437 


Sbjct 


4437 



TTGGG-CCAGCCGAC-GGAATGGTCTCCAAGGGGTGGAGGTTGCTGGCGCCCATCACGGC 3 433 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 

-TGGGACCGGCAGACAGCCTTGAAGGGC-AGGGGTGGCGACTCCTCGCGCCTATTACGGC 3 433 

GTACGCCCAGCAGACGAGAGGCCTCCTAGGGTGTATAATCACCAGCCTGACTGGCCGGGA 3 493 

III I I I I I I I I I I I I I I I I I II II II II I I I I I I I I I I II I I I I I I I I 

CTACTCCCAACAGACGCGAGGCCTACTTGGCTGCATCATCACTAGCCTCACAGGCCGGGA 3 493 

CAAAAACCAAGTGGAGGGTGAGGTCC-AGATCGTGTCAACTGCTACCCAAACCTTCCTGG 3552 

II I I I I I II I I I I I I I I I I I I II I II II II II II III I I I I I I I I 
CAGGAACCAGGTCGAGGGGGAGGTCCAAG-TGGTCTCCACCGCAACACAATCTTTCCTGG 3552 

CAACGTGCATCAATGGGGTATGCTGGACTGTCTACCACGGGGCCGGAACGAGGACCATCG 3612 
I II III I I I I I I I II II I I I I I I I I I I I II II I I I I I I I I I I I I I 

CGACCTGCGTCAATGGCGTGTGTTGGACTGTCTATCATGGTGCCGGCTCAAAGACCCTTG 3612 

-CATCACCCAAGGGTCCTGTCATCCAGATGTATACCAATGTGGACCAAGACCTTGTGGGC 36 71 

I I II I I I I I II III III I I I I I I I I I I I I I I I I I I I I I I I I II III 

CCGGC-CCAAAGGGCCCAATCACCCAAATGTACACCAATGTGGACCAGGACCTCGTCGGC 36 71 

TGGCCCGCTCCTCAAGGTTCCCGCTCATTGACACCCTGTACCTGCGGCTCCTCGGACCTT 3 731 
I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

TGGCAAGCGCCCCCCGGGGCGCGTTCCTTGACACCATGCACCTGCGGCAGCTCGGACCTT 3 731 

TACCTGGTCACGAGGCACGCCGATGTCATTCCCGTGCGCCGGCGAGGTGATAGCAGGGGT 3 791 

III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I 
TACTTGGTCACGAGGCATGCCGATGTCATTCCGGTGCGCCGGCGGGGCGACAGCAGGGGG 3 791 

AGCCTGCTTTCGCCCC-GGCCCATTTCCTACTTGAAAGGCTCCTCGGGGGGTCCGCTGTT 3 850 

I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I 
AGCCTACTCTC-CCCCAGGCCCGTCTCCTACTTGAAGGGCTCTTCGGGCGGTCCACTGCT 3 85 0 

GTGCCCCGCGGGACACGCCGTGGGC — CTATTCAGGGCCGCGGTGTGCACCCGTGGAGTG 39 0 8 

I I I I I I I I I I I I I I I I I I I I I II III I I I I II I I I I I I I I I I I II II 
CTGCCCCTCGGGGCACGCTGTGGGCATCT-TTC-GGGCTGCCGTGTGCACCCGAGGGGTT 39 0 8 

GCTAAAGCGGTGGACTTTAT-CCCTGTGGAGAACCTA-GG-GACAACCATGAGATCCCCG 3965 

II II I I I I I I I I I I I I I III II II I I I I I I I I I I I I I I I I I I I I 
GCGAAGGCGGTGGACTTTGTACCC-GTCGAG — TCTATGGAAACCACTATGCGGTCCCCG 3965 

GTGTTCACGGACAACTCCTCTCCACCAGCAGTGCCCCAGAGC-TTCCAGGTGGCCCACCT 4 02 4 
II I I I I I I I I I I I I I I II II II II II II I I I I I I I I I I I I I I I I I I I II 

GTCTTCACGGACAACTCGTCCCCTCCGGCCGTACCGCAGA-CATTCCAGGTGGCCCATCT 4 02 4 

GCATGCTCCC-ACCGGCAGCGGTAAGAGCACCAAGGTCCCGGCTGCGTACGCAGCCC-AG 4 0 82 

II II III II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
ACACGC-CCCTACTGGTAGCGGCAAGAGCACTAAGGTGCCGGCTGCGTATGCAGCCCAAG 4 0 83 

GGCTACAAGGTG-TTGGTGCTCAACCCCTCTGTTGCTGCAACGCTGGGCTTT-GGTGCTT 414 0 
II II I I I I I I II II II I I I I I II II II II II II II III II II I 

GG-TATAAGGTGCTT-GTCCTGAACCCGTCCGTCGCCGCCACCCTAGG-TTTCGGGGCGT 414 0 

ACATGTCCAAGGCCCATGGGGTTGATCCTAATATCAGGACCGGGGTGAGAACAATTACCA 42 0 0 
I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II II II I I I I 

ATATGTCTAAGGCACATGGTATCGACCCTAACATCAGAACCGGGGTAAGGACCATCACCA 42 0 0 

CTGGCAG-CCCCATCACGTACTCCACCTACGGCAAGTTCCTTGCCGACGGCGGGTGCTCA 42 59 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
C-GGGTGCCCCCATCACGTACTCCACCTATGGCAAGTTTCTTGCCGACGGTGGTTGCTCT 42 59 

GGAGGTGCTTATGACATAATAATTTGTGACGAGTGCCACTCCACGGA-TGCCA-CATCCA 4317 

II II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I II I I 
GGGGGCGCCTATGACATCATAATATGTGATGAGTGCCACTCAACTGACT-CGACCA-CTA 4317 

TCTTGGGCATCGGCACTGTCCTTGACCAAGCAGAGACTGCGGGGGCGAGACTGGTTGTGC 43 7 7 
II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II III I I I I II I I I I 

TCCTGGGCATCGGCACAGTCCTGGACCAAGCGGAGACGGCTGGAGCGCGACTCGTCGTGC 43 7 7 

TCGCCACTGCTACCCCTCCGGGCTCCGTCACTGTGTCC-CATCCTAACATCGAGGAGGTT 4 436 
I I I I I I I I I I I I I I I I I I I I II I I I I I III II I I I I I I I I I I I I I I I I I I I 

TCGCCACCGCTACGCCTCCGGGATCGGTCACCGTG-CCACATCCAAACATCGAGGAGGTG 4 436 

GCTCTGTCCACCACCGGAGAGATCCCCTTTTACGGCAAGGCTATCCCCCTCGAGGTGATC 4 496 
I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I III 

GCTCTGTCCAGCACTGGAGAAATCCCCTTTTATGGCAAAGCCATCCCCATCGAGACCATC 4 496 
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4497 


Query 


4557 


Sbjct 
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4615 


Sbjct 


4615 
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4674 
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4674 
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4734 


Sbjct 


4734 
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4792 


Sbjct 


4792 
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4852 


Sbjct 


4852 
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4912 


Sbjct 


4912 


Query 


4971 


Sbjct 


4971 
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5030 


Sbjct 


5030 
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5088 


Sbjct 


5088 
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5148 


Sbjct 


5148 
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5207 


Sbjct 


5207 


Query 


5265 


Sbjct 


5265 
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5325 


Sbjct 


5325 
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5385 


Sbjct 


5385 


Query 


5445 


Sbjct 


5445 


Query 


5504 


Sbjct 


5503 


Query 


5562 


Sbjct 


5562 



AAGGGGGGAAGACATCTCATCTTCTGCCACTCAAAGAAGAAGTGCGACGAGCTCGCCGCG 4556 
I I I I I I I I II II I I I I I I I I I I I I I II I I I I I I I I II II I I I I I I I I I I I I 

AAGGGGGGGAGGCACCTCATTTTCTGCCATTCCAAGAAGAAATGTGATGAGCTCGCCGCG 4556 

AAGCTGGT-C-GCATTGGGCATCAATGCCGTGGCCTACTACCGCGGTCTTGACGTGTCTG 4614 
I I I I I II I II I II I I I I I I I I II II II I I II I II I I I I I II II I 

AAGCT-GTCCGGCCTCGGAC-TCAATGCTGTAGCATATTACCGGGGCCTTGATGTATCCG 4614 

TCATCCCGACCAGCGGCGATGTTGTCGTCGT-GTCGACCGATGCTCTCATGACTGGCTTT 46 73 
I I I I II II I I I I I II II I I I I I I I I II II I I I I I I I I I I I I I I I I 

TCATACCAACTAGCGGAGACGTCATTGTCGTAG-CAACGGACGCTCTAATGACGGGCTTT 46 73 

ACCGGCGACTTCGACTCTGTGATAGACTGCAACACGTGTGTCACTCAGACAGTCGATTTC 4 733 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I III 

ACCGGCGATTTCGACTCAGTGATCGACTGCAATACATGTGTCACCCAGACAGTCGACTTC 4 733 

AGCCTTGACCCTACCTTTACCATTGAGACAACCA-CGCTCCCCCAGGATGCTGTCTCCA- 4 791 
I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I II II II II II I II 

AGCCTGGACCCGACCTTCACCATTGAGACGACGACCG-TGCCACAAGACGCGGTGT-CAC 4 791 

GGACTCAACGCCGGGGCAGGACTGGCAGGGGGAAGCCAGGCATCTATAGATTTGTGGCAC 4 851 
I I II II II I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I 

GCTCGCAGCGGCGAGGCAGGACTGGTAGGGGCAGGATGGGCATTTACAGGTTTGTGACTC 4 851 

CGGGGGAGCGCCCCTCCGGCATGTTCGACTCGTCCGTCCTCTGTGAGTGCTATGACGCGG 4911 
I II II II I I I I I I I I I I I I I I I I II II II II II I I I I I I I I I I I I I I I I 

CAGGAGAACGGCCCTCGGGCATGTTCGATTCCTCGGTTCTGTGCGAGTGCTATGACGCGG 4911 

GCTGTGCTTGGTATGAGCTCACGCCCGCCGAGAC-TACAGTTAGGCTACGAGCGTACATG 49 7 0 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II III I 

GCTGTGCTTGGTACGAGCTCACGCCCGCCGAGACCT-CAGTTAGGTTGCGGGCTTACCTA 49 7 0 

AACACCCCGGGGCTT-CCCGTGTGCCAGGACCATCTTGAATTTTGGGAGGGCGTCTTTAC 5 02 9 

I I I I I II III II I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I 
AACACACCAGGG-TTGCCCGTCTGCCAGGACCATCTGGAGTTCTGGGAGAGCGTCTTTAC 5029 

GGGCCTCACT CAT AT AG AT GC C C AC TTT-TTATCC C AG AC AAAG C AG AG T G G G - G AG AAC 50 8 7 

I I I I I I I I II I I I I I I I I I I III II I I I I I I I I I I I I I I I II II III 

AGGCCTCACCCACATAGACGCCCA-TTTCTTGTCCCAGACTAAGCAG-GCAGGAGACAAC 50 8 7 

TTTCCTTACCTGGTAGCGTACCAAGCCACCGTGTGCGCTAGGGCTCAAGCCCCTCCCCCA 514 7 

II II I I I I I I I I I I I I I I I I II II I I I I I I II I I I I I I I I II II II III 
TTCCCCTACCTGGTAGCATACCAGGCTACGGTGTGCGCCAGGGCTCAGGCTCCACCTCCA 514 7 

TCGTGGGACCAGATGTGGAAGTGTTTGATCCGCCTTAAACCC-ACCCTCCATGGGCCAAC 52 06 
I I I I I I I I I I I I I I I I I I I I I I I I II II II III II II II II I I I I I I I I 

TCGTGGGACCAAATGTGGAAGTGTCTCATACGGCT-AAAGCCTACGCTGCACGGGCCAAC 52 06 

ACCCCTGCTATACAGACTGGGCGCTGTTCAGAATGAAGTCAC — CCTGACGCACCCAATC 52 6 4 

I I I I I I I I II II I I I I I II I I I I I II II II II II II I I I I I II 

GCCCCTGCTGTATAGGCTGGGAGCCGTTCAAAACGAGGTTACTACC — ACACACCCCATA 52 6 4 

ACCAAATACATCATGACATGCATGTCGGCCGACCTGGAGGTCGTCACGAGCACCTGGGTG 532 4 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
ACCAAATACATCATGGCATGCATGTCGGCTGACCTGGAGGTCGTCACGAGCACCTGGGTG 532 4 

CTCGTTGGCGGCGTCCTGGCTGCTCTGGCCGCGTATTGCCTGTCAACAGGCTGCGTGGTC 53 8 4 

II II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CTGGTAGGCGGAGTCCTAGCAGCTCTGGCCGCGTATTGCCTGACAACAGGCAGCGTGGTC 53 8 4 

ATAGTGGGCAGGATCGTCTTGTCCGGGAAGCCGGCAATTATACCTGACAGGGAGGTTCTC 5 4 4 4 
II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II II I I I I I I I I II II 

ATTGTGGGCAGGATCATCTTGTCCGGAAAGCCGGCCATCATTCCCGACAGGGAAGTCCTT 5 4 4 4 

TACCAGGAGTTCGATGAGATGGAAGAGTGCTC-TCAGCACTTACCGTACATCGAGCAAGG 55 03 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II III I II I I I I I I I I II II 

TACCGGGAGTTCGATGAGATGGAAGAGTGCGCCTCA-CACCTCCCTTACATCGAACA-GG 55 02 

GA-TG-ATGCTCGCTGAGCAGTTCAAGCAGAAGGCCCTCGGCCTCCTGCAGACCGCGTCC 5561 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

GAATGCA-GCTCGCCGAACAATTCAAACAGAAGGCAATCGGGTTGCTGCAAACAGCCACC 5561 

C-GCCATGCAGAGGTTA-T-CACCCCTGCTGTCCAGACCAACTGGCAGAAACTCGAGGTC 5618 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

AAGCAA-GCGGAGGCTGCTGCTCCCGTGGTGGA-AT-CCAAGTGGCGGACCCTCGAAGCC 5618 
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Sbjct 
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5679 


Sbjct 


5679 
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5738 


Sbjct 


5738 
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5798 


Sbjct 


5798 
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5856 


Sbjct 


5856 
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5914 


Sbjct 


5915 


Query 


5974 


Sbjct 


5974 


Query 


6033 


Sbjct 


6033 


Query 


6092 


Sbjct 


6092 


Query 


6152 


Sbjct 


6152 


Query 


6210 


Sbjct 


6210 


Query 


6268 


Sbjct 


6268 


Query 


6325 


Sbjct 


6325 


Query 


6382 


Sbjct 


6382 


Query 


6440 


Sbjct 


6440 


Query 


6500 


Sbjct 


6500 


Query 


6559 


Sbjct 


6558 


Query 


6617 


Sbjct 


6617 


Query 


6675 


Sbjct 


6675 



TTTTGGGCGAAGCACATGTGGAATTTCATCAGTGGGATACAATACTTGGCGGGCCTGTCA 56 7 8 
II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II III I I I I 

TTCTGGGCGAAGCATATGTGGAATTTCATCAGCGGGATACAATATTTAGCAGGCTTGTCC 56 7 8 

ACGCTGCCTGGTAACCCCGCCATTGCTTCATTGATGGCTTTTACAGC-TGCCGTCACCAG 5 73 7 

II I I I I I I I I I I I I I I I I II II III I I I I I I I II I I I I I I I I I I I I I I 
ACTCTGCCTGGCAACCCCGCGATAGCATCACTGATGGCATTCACAGCCT-CTATCACCAG 5 73 7 

CCCACTAACCACTGGCCAAACCCTCCTCTTCAACATATT^ . ^ TGGGTGGCTGCCCA 5797 

III II I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
CCCGCTCACCACCCAACATACCCTCCTGTTTAACATCCTGGGGGGATGGGTGGCCGCCCA 5 79 7 

GCTCGCCGCC-CCCGGTGCCGCTACTGCCTTT-GTGGGTGCTGGCCTAGCTGGCGCCGCC 5855 

II II II III I II III I I I I III II II II III I I I I I I II II 

ACTTGCT-CCTCCCAGCGCTGCTTCTGC-TTTCGTAGGCGCCGGCATCGCTGGAGCGGCT 5 855 

ATCGGCAGCGTTGGACTGGGGAAGGTCCTCGTGGACATTCTTG-CAGGGTATGGCGC-GG 5913 

I I I I I I I I II II I I I I I I I I II Mill III III I I I I I I I I I II II 

GTTGGCAGCATAGGCCTTGGGAAGGTGCTTGTGGATATT-TTGGCAGGTTATGGAGCAGG 5914 

GCGTGGCGGGAGCTCTTGTAGCATTCAAGATCATGAGCGGTGAGGTCCCCTCCACGGAGG 59 73 
I I I I I I II II II II II II III I I I I I I I I I I III I I I I I I I I I I I I I 

G-GTGGCAGGCGCGCTCGTGGCCTTTAAGGTCATGAGCGGCGAGATGCCCTCCACCGAGG 59 73 

ACCTGGTCAATCTGCTGCCC-GCCATCCTCTCGCCTGGAGCCCTTGTAGTCGGTGTGGTC 6 032 
I I I I I I I II II II III II I I I I I I I I I I I I I I I I I I II I I I I I II II 

ACCTGGTTAACCTACT-CCCTGCTATCCTCTCCCCTGGCGCCCTAGTCGTCGGGGTCGTG 6 032 

TGCGCAGCAATACTGCGCCGGCACGTTGGCCC-GGGCGAGGGGGCAGTGCAATGGATGAA 6 091 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I 

TGCGCAGCGATACTGCGTCGGCACGTGGGCCCAGGG-GAGGGGGCTGTGCAGTGGATGAA 6 091 

CCGGCTAATAGCCTTCGCCTCCCGGGGGAACCATGTTTCCCCCACGCACTACGTGCCGGA 6151 
I I I I I I I I I I I I I I I I II I I I I I I I I II II I I I I I I I I I I I I I I I I I I I II 

CCGGCTGATAGCGTTCGCTTCGCGGGGTAACCACGTCTCCCCCACGCACTATGTGCCTGA 6151 

GAGCGATGCAGCCGCCCGCGTCACTGCC-ATACTCAGC-AGCCTCACTGTAACCCAGCTC 62 09 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

GAGCGACGCTGCAGCACGTGTCACT-CAGATCCTCT-CTAGTCTTACCATCACTCAGCTG 62 09 

CTGAGGCGACTGCATCAGTGGAT-AAGCTCGGAGTG-TACCACTCCATGCTCCGGTTCCT 626 7 
I I I I I I II II I I I I I I I I II I III II I I I I I I I I I I I I I I I I II I 

CTGAAGAGGCTTCACCAGTGGATCAA-CGAGGACTGCT-CCACGCCATGCTCCGGCTCGT 626 7 

GGCTAAGGGACATCTGGGACTGGATATGCGA-GGTGCTGAGC-GACTTT-AAGACCTGGC 632 4 
I I I I I I I II I I I I I I I I I I I I I I I I I I I I III I II III I I I I I I I I I I 

GGCTAAGAGATGTTTGGGATTGGATATGC-ACGGTGTTGA-CTGA-TTTCAAGACCTGGC 632 4 

TGAAAG-CCAAGCTCATGCCACAACTGCCTGGGATTCCCTTTGTGTC-C-TGCCAGCGCG 63 81 
I I I I I I I I I I I I I I I I I I I I I I I I I III II I II I II II II I 

TCCA-GTCCAAGCTCCTGCCGCGATTGCC-GGGAGTCCCCTTCT-TCTCATGTCAACGTG 63 81 

GGTATAGGGGGGTCTGGCGAGGAGACGGCATTATGCACACTCGC-TGCC-ACTGTGGAGC 6 439 
I I I I I III I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 

GGTACAAGGGAGTCTGGCGGGGCGACGGCATCATGCAAAC-CACCTGCCCA-TGTGGAGC 6 439 

TGAGATCACTGGACATGTCAAAAACGGGACGATGAGGATCGTCGGTCCTAGGACCTGCAG 6 499 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II 

ACAGATCACCGGACATGTGAAAAACGGTTCCATGAGGATCGTGGGGCCTAGGACCTGTAG 6 499 

GAACATGTGG-AGTGGGACGTTCCCCATTAACGCCTACACCACGGGCCCCTGTACTCCCC 655 8 

I I I I I I I I I III II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II III 

TAACACGTGGCA-TGGAACATTCCCCATTAACGCGTACACCACGGGCCCCTGCACGCCC- 655 7 

TTCCTG-CGCCGAACTATAAGTTCG-CGCTGTGGAGGGTGTCTGCAGAGGAATACGTGGA 6616 
I II I I I I I II III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

TCCCCGGCGCCAAATTATTC-TAGGGCGCTGTGGCGGGTGGCTGCTGAGGAGTACGTGGA 6616 

GATAAGGCGGGTGGGGGACTTCCACTACGT-ATCGGGTATGACTACTGACAATCTTAAA- 66 7 4 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

GGTTACGCGGGTGGGGGATTTCCACTACGTGA-CGGGCATGACCACTGACAA-CGTAAAG 66 7 4 

TGCCCGTGCCAGATCCCATCGCCCGAATTTTTCACAGAATTGGACGGGGTGCGCCTACAC 6 73 4 
I I I I I I I I III I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 

TGCCCGTGTCAGGTTCCGGCCCCCGAATTCTTCACAGAAGTGGATGGGGTGCGGTTGCAC 6 73 4 
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6793 
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6852 


Sbjct 


6852 
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6912 


Sbjct 


6912 
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6970 


Sbjct 


6970 


Query 


7029 


Sbjct 


7029 


Query 


7089 


Sbjct 


7089 


Query 


7149 


Sbjct 


7149 


Query 


7207 


Sbjct 


7207 


Query 


7266 


Sbjct 


7266 


Query 


7324 


Sbjct 


7324 


Query 


7384 


Sbjct 


7384 


Query 


7440 


Sbjct 


7437 


Query 


7494 


Sbjct 


7494 


Query 


7554 


Sbjct 


7554 


Query 


7613 


Sbjct 


7610 


Query 


7671 


Sbjct 


7668 


Query 


7730 


Sbjct 


7727 


Query 


7789 


Sbjct 


7786 



AGGTTTGCGCCCCCTTGCAAGCCCTTGCTGCGGGAGGAGGT-ATCATTCA-GAGTAGGAC 6 792 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AGGTACGCTCCAGCGTGCAAACCCCTCCTACGGGAGGAGGTCA-CATTCCTG-GTCGGGC 6 792 

TCCA-CGAGTACCCGGTGGGGTCGCAATTACCTTGCGAGCCCGAACCGGACGTAGCCGTG 6 851 

II I I I I I I I III I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I III 
TCAATCAA-TACCTGGTTGGGTCACAGCTCCCATGCGAGCCCGAACCGGACGTAGCAGTG 6 851 

TTGACGTCCATGCTCACTGATCCCTCCCATATAACAGCAGAGGCGGCCGGGAGAAGGTTG 6911 

I II I I I I I I I I I I I II I I I I I I I I II II II III I I I I I I III II 

CTCACTTCCATGCTCACCGACCCCTCCCACATTACGGCGGAGACGGCTAAGCGTAGGCTG 6911 

GCGAGAGGG-TCACCCCCTTC-TATGGCCAGCTCCTCGGCTAGCCAGCTGTCCGCTCCAT 6969 

II II III II I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I II II I 
GCCAG-GGGATCTCCCCCCTCCT-TGGCCAGCTCATCAGCTAGCCAGCTGTCTGCGCCTT 6969 

CTCTC-AAGGCAACTTGCACCGCCAACCATGACTCCCCTGACGCCGAGCTCATAGAGGCT 702 8 

III I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
C-CTTGAAGGCAACATGCACTACCCGTCATGACTCCCCGGACGCTGACCTCATCGAGGCC 702 8 

AACCTCCTGTGGAGGCAGGAGATGGGCGGCAACATCACCAGGGTTGAGTCAGAGAACAAA 7 0 8 8 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I II II 
AACCTCCTGTGGCGGCAGGAGATGGGCGGGAACATCACCCGCGTGGAGTCAGAAAATAAG 7 0 8 8 

GTGGTGATTCTGGACTCCTTCGATCCGCTTGTGGCAGAGGAGGATGAGCGGGAGGTCTCC 7148 

II II III I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II III 
GTAGTAATTTTGGACTCTTTCGAGCCGCTCCAAGCGGAGGAGGATGAGAGGGAAGTATCC 7148 

GTACCTGCAGAAATTCTGCGGAAGTCTC-GGAGATTCGCC-CGGGCCCTGCCCGTCTGGG 72 06 
II II II II II I I I I I I I III I III I I I I II II II I I I I I I I I I I 

GTTCCGGCGGAGATCCTGCGGAGGTC-CAGGAAATTC-CCTCGAGCGATGCCCATATGGG 72 06 

CGCGGCCGGACTACAACCCCCCGCTAGT-AGAGACGTGGAAAAAGCCTGACTACGAACCA 72 65 

I II I I I I I I I I I I I I I II II II I I I I I I I I I I I II I I I I I I I II 
CACGCCCGGATTACAACCCTCCACT-GTTAGAGTCCTGGAAGGACCCGGACTACGTCCCT 7265 

CCTGTGGTCCATGGCTGCCCGCTACCACCT-CCACGGTCCCCTCCTG-TGCCTCCGCCTC 7323 

II I I I I I II II II II I II III III II II I I I I I I I II II II I 
CCAGTGGTACACGGGTGTCCATTGCCGCCTGCCAAGG-CCCCTCC-GATACCACCTCCAC 7323 

GGAAAAAGCGTACGGTGGTCCTCACCGAATCAACCCTATCTACTGCCTTGGCCGAGCTTG 73 83 

III III I I I I I I I I I I I I I I I I I III I III I I I I I I I I I I I I I I I I 
GGAGGAAGAGGACGGTTGTCCTGTCAGAATCTACCGTGTCTTCTGCCTTGGCGGAGCTCG 73 83 

CCACCAAA-AGTTTTGGCAGCTCCTCAA-CTTCCGGCATT — ACGGGCGACAATACGACA 7 439 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CCAC-AAAGACCTTCGGCAGCTCCG-AATCGTC-GGCCGTCGACAG-CGGCA CGGCA 7 436 

ACATCCTCTGA-GCCC-GCCCCTTCTG — G-CTGccccccoG-ACTCCGACGTTGAGTCC 7 493 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
ACGGCCTCTCCTGACCAGCCC-TCC-GACGACGGCGACGCGGGA-TCCGACGTTGAGTCG 7 493 

TATTCTTCCATGcccccccTGGAGGGGGAGCCTGGGGATCCGGATCTCAGCGACGGGTCA 7553 
II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

TACTCCTCCATGCCCCCCCTTGAGGGGGAGCCGGGGGATCCCGATCTCAGCGACGGGTCT 7553 

TGGTCGACGGTCAGTAGTGG-GGCCGACACGGAAGATGTCGTGTGCTGCTCAATGTCTTA 7612 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TGGTCTACCGTAAGC-GAGGAGGCT-AGT-G-AGGACGTCGTCTGCTGCTCGATGTCCTA 76 09 

TTCCTGGACAGGCGCACTCG-TCACCCCGTGCGCTGCGGAAGAA-CAAAAACTGCCCATC 76 7 0 

I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I III I II I I I I I I I I I 

CACATGGACAGGCGCCCT-GATCACGCCATGCGCTGCGGAGGAAACCAAG-CTGCCCATC 766 7 

AACGCACTGAGCAACTCGTTGCTACGCCATCACAATCT-GGTGTATTCCACCACTTCACG 7 72 9 

II I I I I I I I I I I I I I I I I I I I II II I I I I I II III III I II II II II 
AATGCACTGAGCAACTCTTTGCTCCGTCACCACAA-CTTGGTCTATGCTACAACATCTCG 7 72 6 

CAGTGCTTGCCAAAGGCAGAAGAAAGTCACATTTGACAGACTGCAAGTTCTGGAC-AGCC 7 7 8 8 

III II III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II 
CAGCGCAAGCCTGCGGCAGAAGAAGGTCACCTTTGACAGACTGCAGGTCCTGGACGA-CC 7 7 85 

ATTACCAGGACGTGCTCAAGGAGGTCAAAGC-AGCGGCGTCAAAAGTGAAGGCTAA-CTT 7 8 46 
I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I III I I I I I I I I III 

ACTACCGGGACGTGCTCAAGGAGATGAAGGCGAA-GGCGTCCACAGTTAAGGCTAAACTT 7 8 4 4 
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7847 


Sbjct 


7845 


Query 


7906 


Sbjct 


7903 


Query 


7964 


Sbjct 


7961 


Query 


8022 


Sbjct 


8019 


Query 


8082 


Sbjct 


8079 


Query 


8141 


Sbjct 


8138 


Query 


8200 


Sbjct 


8197 


Query 


8257 


Sbjct 


8254 


Query 


8317 


Sbjct 


8314 


Query 


8374 


Sbjct 


8371 


Query 


8433 


Sbjct 


8430 


Query 


8493 


Sbjct 


8490 


Query 


8551 


Sbjct 


8548 


Query 


8610 


Sbjct 


8606 


Query 


8668 


Sbjct 


8665 


Query 


8727 


Sbjct 


8724 


Query 


8785 


Sbjct 


8782 


Query 


8845 


Sbjct 


8842 


Query 


8902 


Sbjct 


8899 



GCTATCCGTAGAGGAAGCTTGCA-GCCTGACGCCCCCACATTCAGCCAAATCCAAGTTTG 79 05 

I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I III II I I I I 

-CTATCCGTGGAGGAAGCCTGTAAGC-TGACGCCCCCACATTCGGCCAGATCTAAATTTG 79 02 

GCTATGGGGCAAAAGACGTCCGTTGCC-ATGCCAGAAAGGCCGT-AGCCCACATCAACTC 7963 
I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I II I I I I I III 

GCTATGGGGCAAAGGACGTCCGGAACCTAT-CCAGCAAGGCCGTTAACC-ACATCCGCTC 796 0 

CGTGTGGAAAGACCTT-CTGGAAGACAGTGTA-ACACCAATAGACACTACCATCATGGCC 8 021 

I I I I I I I I I III II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
CGTGTGGAAGGAC-TTGCTGGAAGACACTG-AGACACCAATTGACACCACCATCATGGCA 8 018 

AAGAACGAGGTTTTCTGCGTTCAGCCTGAGAAGGGGGGTCGTAAGCCAGCTCGTCTCATC 8 0 81 

II II I I I I I I I I I I I I I I II II I I I I I I I I I I I II I I I I I I I I I I I II III 
AAAAATGAGGTTTTCTGCGTCCAACCAGAGAAGGGGGGCCGCAAGCCAGCTCGCCTTATC 8 0 7 8 

GTGTTCCCCGACCTGGGCGTGCGCGTGTGCGAGAAGATGGCCCTGTACGACGTGGT-TAG 814 0 
II I I I I I II I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

GTATTCCCAGATTTGGGGGTTCGTGTGTGCGAGAAAATGGCCCTTTACGATGTGGTCTC- 813 7 

CAAGCTCCCCCTGGCCGTGATGGGAAGCTCC-TACGGATTCCAATACTCACCAGGACAGC 8199 
II I I I I I I I I I I I I I I I I I I II I II II I I I I I I I I I I I I I II I I I I I I I 

CACCCTCCCTCAGGCCGTGATGGGCT-CTTCATACGGATTCCAATACTCTCCTGGACAGC 8196 

GGGTTGAATTCCTCGTGCAA-GCGTGGAA-GTCCAAGAAGAC-CCCGATGGGGTTCTCGT 82 56 
I I I I II I I I I I III II II I I I I I I I I I I I I I III I I I I I III I I 

GGGTCGAGTTCCTGGTG-AATGCCTGGAAAG-CGAAGAA-ATGCCCTATGGGCTTCGCAT 82 53 

ATGATACCCGCTGTTTTGACTCCACAGTCACTGAGAGCGACATCCGTACGGAGGAGGCAA 8316 
I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I III 

ATGACACCCGCTGTTTTGACTCAACGGTCACTGAGAATGACATCCGTGTTGAGGAGTCAA 8313 

TTTACCAATGTTGTGACCTGGACCCCC-AAGCCCG-CGTGGCCATCAAG-TCCCTCACTG 83 73 

I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I III II I I I I I I 
TCTACCAATGTTGTGACTTGG-CCCCCGAAGCCAGACA-GGCCAT-AAGGTCGCTCACAG 83 7 0 

AGAGGCTTTATGTTGGGGGCCCTCTTACCAATTC-AAGGGGGGAAAACTGCGGCTACCGC 8 432 

II I I I I I I I I I I I I I I I I I I II I I I I I II III I I I I I I I I I I I I III 
AGCGGCTTTACATCGGGGGCCCCCTGACTAATTCTAAAGGGC-AGAACTGCGGCTATCGC 8 429 

AGGTGCCGCGCGAGCGGCGTACTGACAACTAGCTGTGGTAACACCCTCACTTGCTACATC 8 492 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II III I 

CGGTGCCGCGCGAGCGGTGTACTGACGACCAGCTGCGGTAATACCCTCACATGTTACTTG 8 4 89 

AAGGCC-CGGGCAGCCTGTCGAGCCGC-AGGGCTCCAGGACTGCACCATGCTCGTGTGTG 855 0 
I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I II I 

AAGGCCGCTG-CGGCCTGTCGAGCTGCGAAG-CTCCAGGACTGCACGATGCTCGTATGCG 85 4 7 

GCGACGAC-TTAGTCGTTATCTGTGAAAGTGCGGGGGTCCAGGAGGACGCGGCGAGCCTG 86 09 
I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I 

GAGACGACCTT-GTCGTTATCTGTGAAAGCGCGGGGACCCAAGAGGACGAGGCGAGCCT- 86 05 

A-GAGCCTTCACGGAGGCTATGACCAGGTACTCCGo ^ , ACAAC 866 7 

I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I III 

ACGGGCCTTCACGGAGGCTATGACTAGATACTCTGCCCCCCCTGGGGACCCGCCCA-AAC 866 4 

CAGAATAC GACTTGGAGCTT-ATAACATCATGCTCCTCCAACGTGTCAGTCGCCCACGAC 8 72 6 
I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CAGAATAC GACTTGGAG-TTGATAACATCATGCTCCTCCAATGTGTCAGTCGCGCACGAT 8 723 

GGCG-CTGG-AAAGAGGGTCTACTACCTTACCCGTGACCCTACAACCCCCCTCGCGAGAG 8 7 8 4 
I I I I I I III I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I III I I 

G -CATC TGGC AAA- AGGGTGTACTATCTCACCCGTGACCCCACCACCCCCCTTGCGCGGG 8 7 81 

CCGCGTGGGAGACAGCAAGACACACTCCAGTCAATTCCTGGCTAGGCAACATAATCATGT 8 8 4 4 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CTGCGTGGGAGACAGCTAGACACACTCCAGTCAATTCCTGGCTAGGCAACATCATCATGT 8 8 41 

TTGCCCCCACACT-GTGGGCGAGGATGATACTGATGACCCATTTCTT-TAGCGTCCT-CA 89 01 

III I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

ATGCGCCCAC-CTTGTGGGCAAGGATGATCCTGATGACTCATTTCTTCTC-CATCCTTC- 8 89 8 

TAGC-CAGGGATCAGCTTGAACAGGCTCTTA-ACTGTGAGATCTACGGAGCCTGCTACTC 8959 
I I I I I I I I I II I I I I I I I II II I I III I I I I I I I I I I I I I I I I I I I I 

TAGCTCAGGAA-CAACTTGAAAAAGCCCT-AGATTGTCAGATCTACGGGGCCTGTTACTC 8956 
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8960 


Sbjct 


8957 


Query 


9019 


Sbjct 


9016 


Query 


9079 


Sbjct 


9076 


Query 


9138 


Sbjct 


9135 


Query 


9196 


Sbjct 


9193 


Query 


9255 


Sbjct 


9252 


Query 


9315 


Sbjct 


9312 


Query 


9374 


Sbjct 


9371 


Query 


9428 


Sbjct 


9426 


Query 


9482 


Sbjct 


9486 


Query 


9539 


Sbjct 


9545 



CATAGAACCACTGGATCTACCTCCA-ATCATTCAAAGACTCCATGGCCTCAGCGCATTTT 9 018 
III II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CATTGAGCCACTTGACCTACCTC-AGATCATTCAACGACTCCATGGCCTTAGCGCATTTT 9 015 

CACTCCACAGTTACTCTCCAGGTGAAATCAATAGGGTGGCCGCATGCCTCAGAAAACTTG 9 0 7 8 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CACTCCATAGTTACTCTCCAGGTGAGATCAATAGGGTGGCTTCATGCCTCAGGAAACTTG 9 0 75 

GGGTCCCGCCCTTGCGAG-CTTGGAGACACCGGGCCCGGAGCGTCCGCGCTAGGCTTCTG 913 7 
I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I III 

GGGTACCGCCCTTGCGAGTCT-GGAGACATCGGGCCAGAAGTGTCCGCGCTAGGCTACTG 913 4 

TCC-AGAGGAGGCAGGGCTGCCA-TATGTGGCAAGTACCTCTTCAACTGGGCAGTAAGAA 9195 
III II II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

TCCCAGGGGGGG-AGGGCTGCCACT-TGTGGCAAGTACCTCTTCAACTGGGCAGTAAGGA 9192 

CAAAGCTCAAACTCACTCCAATAGCGGCCGCTGGCCG-GCTGGACTTGTCCGGTTGGTTC 92 5 4 
I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I II III I I I I I I I 

CCAAGCTCAAACTCACTCCAATCCCGGCTGC-GTCCCAGTTGGATTTATCCAGCTGGTTC 92 51 

ACGGCTGGCTACAGCGGGGGAGACATTTATCACAGCGTGTCTCATGCCCGGCCCCGCTGG 9314 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

GTTGCTGGTTACAGCGGGGGAGACATATATCACAGCCTGTCTCGTGCCCGACCCCGCTGG 9311 

TTC-TGGTTTTGCCTACTCCTGCTCGCTGCAGGGGTAGGCATCTACCTCCTCCCCAACCG 93 73 
III II I I I I I I I I I I I I II III I I I I I I I I I I I I I I I II I I I I I I I I I I I 

TTCATG-TGGTGCCTACTCCTACTTTCTGTAGGGGTAGGCATCTATCTACTCCCCAACCG 93 7 0 

ATGAAGGTTGGG-G-TAAACACTCC-GGCCTCTTAAGCCATTTCCTG;: ;: vtttt ttt 9 42 7 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 

ATGAACG — GGGAGCTAAACACTCCAGGCCAAT-AGGCCAT — CCTGTTTTTTTCCCTTT 9 42 5 



ttct fcfcttcccc c-ctttAAT — GGTGGCTCCATCTTAGCCCTAGTCACGGCTAGCTGTG 953 8 
II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TT-TTTTTCCTTTTCTTTCCTTTGGTGGCTCCATCTTAGCCCTAGTCACGGCTAGCTGTG 954 4 

AAAGGTCCGTGAGCCGCATGACTGCAGAGAGTGCTGATACTGGCCTCTCTGCAGATCA 9596 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AAAGGTCCGTGAGCCGCTTGACTGCAGAGAGTGCTGATACTGGCCTCTCTGCAGATCA 96 02 



Score = 3354 bits (1816), Expect = 0.0 
Identities = 3942/4944 (79%), Gaps = 244/4944 (4%) 
Strand=Plus/Plus 

GCCAGCCCCCTGA-TGGGGGCGACACTCCACCATGA-ATCACTCCCCTGTGAGGAACTAC 
I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GCCAGCCCCC-GATTGGGGGCGACACTCCACCAT-AGATCACTCCCCTGTGAGGAACTAC 

TGTCTTCACGCAGAAAGCGTCTAGCCATGGCGTTAGTATGAGTGTCGTGCAGCCTCCAGG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TGTCTTCACGCAGAAAGCGTCTAGCCATGGCGTTAGTATGAGTGTCGTGCAGCCTCCAGG 

AcccccccTCCCGGGAGAGCCATAGTGGTCTGCGGAACCGGTGAGTACACCGGAATTGCC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
ACCCCCCCTCCCGGGAGAGCCATAGTGGTCTGCGGAACCGGTGAGTACACCGGAATTGCC 

AGGACGACCGGGTCCTTTCTTGGATAAACCCGCTCAATGCCTGGAGATTTGGGCGTGCCC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AGGACGACCGGGTCCTTTCTTGGATCAACCCGCTCAATGCCTGGAGATTTGGGCGTGCCC 

CCGCAAGACTGCTAGCCGAGTAGTGTTGGGTCGCGAAAGGCCTTGTGGTACTGCCTGATA 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CCGCGAGACTGCTAGCCGAGTAGTGTTGGGTCGCGAAAGGCCTTGTGGTACTGCCTGATA 

GGGTGCTTGCGAGTGCCCCGGGAGGTCTCGTAGACCGTGCACCATGAGCACGAATCCTAA 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GGGTGCTTGCGAGTGCCCCGGGAGGTCTCGTAGACCGTGCACCATGAGCACGAATCCTAA 

ACCTCAAAGAAAAACCAAACGTAACACCAACCGTCGCCCACAGGACGTCAAGTTCCCGGG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
ACCTCAAAGAAAAACCAAACGTAACACCAACCGCCGCCCACAGGACGTCAAGTTCCCGGG 



Query 


1 


Sbjct 


1 


Query 


59 


Sbjct 


59 


Query 


119 


Sbjct 


119 


Query 


179 


Sbjct 


179 


Query 


239 


Sbjct 


239 


Query 


299 


Sbjct 


299 


Query 


359 


Sbjct 


359 
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419 


Sbjct 


419 


Query 


479 


Sbjct 


479 


Query 


539 


Sbjct 


539 


Query 


599 


Sbjct 


599 


Query 


658 


Sbjct 


658 


Query 


718 


Sbjct 


718 


Query 


778 


Sbjct 


778 


Query 


838 


Sbjct 


838 


Query 


897 


Sbjct 


897 


Query 


954 


Sbjct 


954 


Qu e r y 


1011 


Sbjct 


1011 


Query 


1070 


Sbjct 


1070 


Query 


1128 


Sbjct 


1128 


Query 


1187 


Sbjct 


1187 


Query 


1244 


Sbjct 


1242 


Query 


1302 


Sbjct 


1302 


Query 


1362 


Sbjct 


1362 




1422 


Sbjct 


1422 


Query 


1481 


Sbjct 


1481 



TGGCGGTCAGATCGTTGGTGGAGTTTACTTGTTGCCGCGCAGGGGCCCTAGATTGGGTGT 4 7 8 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 

CGGTGGTCAGATCGTCGGTGGAGTTTACCTGTTGCCGCGCAGGGGCCCCAGGTTGGGTGT 4 7 8 

GCGCGCGACGAGGAAGACTTCCGAGCGGTCGCAACCTCGAGGTAGACGTCAGCCTATCCC 53 8 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II II II I I I I I I I I 

GCGCGCGACTAGGAAGACTTCCGAGCGGTCGCAACCTCGTGGAAGGCGACAACCTATCCC 53 8 

CAAGGCACGTCGGCCCGAGGGCAGGACCTGGGCTCAGCCCGGGTACCCTTGGCCCCTCTA 59 8 
I I I I I I II I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CAAGGCTCGCCAGCCCGAGGGTAGGGCCTGGGCTCAGCCCGGGTACCCCTGGCCCCTCTA 59 8 

TGGCAATGAGGG-TTGCGGGTGGGCGGGATGGCTCCTGTCTCCCCGTGGCTCTCGGCCTA 65 7 
I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

TGGCAATGAGGGCTTG-GGGTGGGCAGGATGGCTCCTGTCACCCCGTGGCTCTCGGCCTA 65 7 

GCTGGGGCCCCACAGACCCCCGGCGTAGGTCGCGCAATTTGGGTAAGGTCATCGATACCC 717 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

GTTGGGGCCCCACGGACCCCCGGCGTAGGTCGCGCAATTTGGGTAAGGTCATCGATACCC 717 

TTACGTGCGGCTTCGCCGACCTCATGGGGTACATACCGCTCGTCGGCGCCCCTCTTGGAG 7 7 7 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I 

TCACGTGCGGCTTCGCCGATCTCATGGGGTACATTCCGCTCGTCGGCGCCCCCCTAGGGG 7 7 7 

GCGCTGCCAGGGCCCTGGCGCATGGCGTCCGGGTTCTGGAAGACGGCGTGAACTATGCAA 83 7 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

GCGCTGCCAGGGCCCTGGCGCATGGCGTCCGGGTTCTGGAGGACGGCGTGAACTATGCAA 83 7 

CAGGGAACCTTCCTGGTTGCTC-TTTCTCTATCTTCCTTCTGGCCCTGCTCTCTTGCCTG 896 

I I I I I I I II II I I I I I I I I III I I I I I I I I I I I I I I I I I I I I II II II 
CAGGGAATCTGCCCGGTTGCTCCTTT-TCTATCTTCCTTTTGGCTTTGCTGTCCTGTTTG 896 

ACTGTGCCC-GCTTCAGCCTACCAAGTGCGCAAT-TCCTCGGG-GCTTTACCATGTCACC 953 

II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
ACCAT-CCCAGCTTCCGCTTATGAAGTGCGCAACGTA-TCCGGAG-TGTACCATGTCACG 953 

AATGATTGC-CCTAACTCGAGTATTGTGTACGAGGCGGCCGA — TGCCATCCTGCACACT 1010 
II II III II III I II I I I I I I I I I I I I I II II II III I I I I II 

AACGACTGCTCC-AACGCAAGCATTGTGTATGAGGCAGCGGACATG — ATCATGCATACC 1010 

CCGGGGTGTGT-CCCTTGCGTTCGCGAGGGTAACGCCTCGAGGTGTTGGGTGGCGGTGAC 1069 

II I I I I I II I I I I I I I I I I I III III I I I I I II I I I I I III I II 
CCCGGGTGCGTGCCCT-GCGTTCGGGAGAACAACTCCTCCCGCTGCTGGGTAGCGCTCAC 1069 

CCCCACGGTGGCCACCAGGGACGGCAAAC-TCCCCACAACG-CAGCTTCGACGTCATATC 112 7 

I I I I I I I II I I I I I III I I I I I I I I I I III I I I I I I I I III II 

TCCCACGCTCGCGGCCAGGAACG-CTAGCGTCCCCACTACGAC-GATACGACGCCATGTC 112 7 

GATCTGCTTGTCGGGAGCGCCACC-CTCTGCTCGGCCCTCTACGTGGGGGACCTGTGCGG 1186 

III I I I I II III III I I I I I I I I I I II I I I I I I I I I II II I I I I I 
GATTTGCTCGTTGGG-GCGGCTGCTCTCTGCTCCGCTATGTACGTGGGAGATCTCTGCGG 1186 

GTCTGTCTTTCTT-GTTGGTCAACTGTTTACCTTCTCTCC-CAGGCGCCACTG-GACGAC 12 43 

I I I I I I I I I I II I II I I I I I I I I I I I I I II I I II III I III I 

ATCTGT-TTTCCTCGTCGCCCAGCTGTTCACCTTCTCGCCTC-GCCGGCAC-GAGAC-A- 12 41 

GCA-AG-ACTGCAATTGTTCTATCTATCCCGGCCATATAACGGGTCATCGCATGGCATGG 13 01 
I I II I I I I I I I I I I II II I I I I I I I I I I I I II I I I I I II I I I I I III 

GTACAGGACTGCAATTGCTCAATATATCCCGGCCACGTGACAGGTCACCGTATGGCTTGG 13 01 

GATATGATGATGAACTGGTCCCCTACGGCAGCGTTGGTGGTAGCTCAGCTGCTCCGGATC 1361 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I 

GATATGATGATGAACTGGTCACCTACAGCAGCCCTAGTGGTATCGCAGTTACTCCGGATC 1361 

CCACAAGCCATCATGGACATGATCGCTGGTGCTCACTGGGGAGTCCTGGCGGGCATAGCG 1421 

I I I I I I I I II I I I I III I II II II II I I I I I I I I I I I I I I I I I I II 
CCACAAGCTGTCGTGGATATGGTGGCGGGGGCCCATTGGGGAGTCCTAGCGGGCCTTGCC 1421 

TATT-TCTCCATGGTGGGGAACTGGGCGAAGGTCCTGGTAGTGCTGCTGCTATTTGCCGG 148 0 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I III I III I I I I II I I I I I I I I 
TACTAT-TCCATGGTGGGGAACTGGGCTAAGGTTCTGATTGTGATGCTACTCTTTGCCGG 148 0 

CGTCGACGCGGAAACCCACGTCACCGGGGGAAATGCCGGCCGCAC-CACGGCT-GGGCTT 153 8 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I 

CGTTGACGGGGGAACCTATGTGACAGGGGGGAC-GATGGCCAAAAACACC-CTCGGGATT 153 8 
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1539 


Sbjct 


1539 


Query 


1595 


Sbjct 


1595 


Query 


1654 


Sbjct 


1655 


Query 


1713 


Sbjct 


1713 


Query 


1770 


Sbjct 


1767 


Query 


1824 


Sbjct 


1824 


Query 


1882 


Sbjct 


1882 


Query 


1939 


Sbjct 


1939 


Query 


1997 


Sbjct 


1997 


Query 


2052 


Sbjct 


2052 


Query 


2110 


Sbjct 


2110 


Query 


2168 


Sbjct 


2168 


Query 


2227 


Sbjct 


2227 


Query 


2286 


Sbjct 


2286 


Query 


2346 


Sbjct 


2346 


Query 


2404 


Sbjct 


2404 


Query 


2464 


Sbjct 


2463 




2521 


Sbjct 


2521 


Query 


2580 


Sbjct 


2580 



— GTTGGTCTCCTTACACCAGGCGCCAAGC-AGAACATCCAACT-GATCAACACCAACGG 159 4 

II III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

ACGTCCCTCTT-TT-CACCCGG-GTCATCCCAGAAAATCCAGCTTG-TAAACACCAACGG 159 4 

CAGTTGGCACATCAATAGCACGGCCTTGAATTGCAATGAAAGCCTTAACACCGGCTGG-T 1653 
III I I I I I I I I I I I II II III I I I I I I I I I I I I III I I I I I II I I 

CAGCTGGCACATCAACAGGACTGCCCTGAACTGCAATGACTCCCTCAACACTGGGTTCCT 165 4 

TAGCAGGGCTCTTCTATCAA-CACAAATTCAACTCTTCAGGCTGTCCTGAGAGGTTGGCC 1712 
I II I III I I I I I I I I I I I I I I I I I I I II II II II III I I I I I I 

T-GCTGCGCTGTTCTA-CGTGCACAAGTTCAACTCATCTGGATGCCCAGAGCGCATGGCC 1712 

AGCTGCCGACGCCTT — AC-CGATTTTGCCCAGGGCTGGGGTCCTATCAGTTATGCCAAC 1769 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 
AGCTGCAGCC-CCATCGACGCG-TTC-GCTCAGGGGTGGGGGCCCATCACTTA— C-AAT 1766 

G-G — A-AGCGGCCTCG-ACGA-ACGCCCCTACTGCTGGCACTACCCTCCAAGACCTTGT 1823 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GAGTCACA-CAGC-TCGGACCAGAGGCCT-TATTGTTGGCACTACGCACCCCGGCCGTGC 1823 

GGCATTGTGCCCGCAAAG-AGCGTGTGTGGCCCGGTATATTGCTTCACTCCCA-GCCCCG 18 81 
II II II I I I I I I II I I I I I I I I II II II I I I I I I I I I I I I I I I I I 

GGTATCGTACCCGCGGCGCAG-GTGTGTGGTCCAGTGTACTGCTTCAC-CCCAAGCCCTG 18 81 

TGGTGGTGGGAACGACCGACAGGT-CGGGCG-CGCCTACCTACAGCTGGGGTGCA-AATG 193 8 
I I I I I I I I I I I I I I I I I I III III II I I I I I I I I I I I I I I I I I I I I I I 

TCGTGGTGGGGACGACCGACCGGTTCGG-CGTC-CCTACGTACAGTTGGGGGG-AGAATG 193 8 

ATACGGATGT-CTTCGTCCTTAACAACAC-CAGGCCACCGCTGGGCAATTGGTTCGGTTG 1996 
I I I I I I II II I II I I I I I I I I I I I I I I I MM I I I I I I I I I I II II 

AGACGGACGTGCTGCTTC-TTAACAACACGC-GGCCGCCGCAAGGCAACTGGTTTGGCTG 1996 

TACCTGGATGAACT — CAACTGGATTCACCAA-AGTGTGCGGAGCGCCCCCTTGTGT — C 2 051 

I II I I I I I I I I I I I I I I I I I M M M I I I I I I I I I I I I I I I I I I 
TACATGGATGAA-TAGCA-CTGGGTTCACCAAGAC-GTGCGGGG-GCCCCCC-GTGTAAC 2 051 

ATCGGAGGGG-TGGGCAACAACACCTTG-CTCTGCCCCACTGATTGCTTCCGCAAACATC 2109 

II II I II II I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I II II I 
ATCGG-GGGGATCGGCAATAAAACCTTGAC-CTGCCCCACGGACTGCTTCCGGAAGCACC 2109 

CGGAAGCCACATACTCTCG-GTGCGGCTCCGGTCCCTGGATT-ACACCCAGGTGCATGGT 216 7 
I II I I I I I III I I III II II II II III II I I I I I I I I III I I I I 

CCGAGGCCACTTACAC-CAAGTGTGGTTCGGGGCCTTGG-TTGACACCCAGATGCTTGGT 216 7 

CGACTACCCGTATAGGCTTTGGCACTATCCTTGTACCATCAA-TTACACCATATTCAAAG 2 2 2 6 
I I II I I I I II I I I I I I I I I I I I I I II II II I I I I II I I I I I I II II I 

CCACTACCCATACAGGCTTTGGCAC TACCCCTGCACTGTCAACTTT-ACCATCTTCAAGG 2 2 2 6 

TCAGGATGTACGTGGGAGGG-GTCGAGCACAGGCTGGAAGCGGCCTGCAACTGGACGCGG 2 2 85 

I II II II II II I I I I III M M M M M M I Mill II I I I I I I II II II 
TTAGGATGTACGTGGG-GGGAGTGGAGCACAGGCTCGAAGCCGCATGCAATTGGACTCGA 2 2 85 

GGCGAACGCTGTGATCTGGAAGACAGGGACAGGTCCGAGCTCAGCCCGTTGCTGCTGTCC 23 45 

II II II III I I II II II I I I I I I I I I II I I II I II II II II II II II II 
GGAGAGCGTTGTAACCTGGAGGACAGGGACAGATCAGAGCTTAGCCCGCTGCTGCTGTCT 23 45 

ACCACACAGTGGCAGGTCCTT-CCGTGTTCTTTCACGACCCTGCCAGC-CTTGTCCACCG 2 4 03 
II II II II II II II II II I I I I I I I I I I I II II II II II II II II I 

ACAACGGAGTGGCAGGTA-TTGCCCTGTTCCTTCACCACCCTACCGGCTCT-GTCCACTG 2 4 03 

GCCTCATCCACCTCCACCAGAACATTGTGGACGTGCAGTACTTGTACGGGGTAGGGTCAA 2 463 

I I II II I II II I II II II I I I I I I I I I II III II II II I II II II I 
GTTTGATCCATCTCCATCAGAACGTCGTGGACGTACAATACCTGTACGGTATAGGGTCG- 2 462 

GCA-TCG-CGTCCTGGGCCATTAAGTGGGAGTACGTCGT-TCTCCTGTTCCTTCTGCTTG 2 52 0 

II I I I II II II II II I I I I I I I I III I I I II II II II II II I 
GCGGTTGTC-TCCTTTGCAATCAAATGGGAGTATGTCCTGT-TGCTCTTCCTTCTTCTGG 2 52 0 

CAGACGCGCGCGTCTGCT-CCTGCTTGTGGATGATGTTACTCATATCCCAAGCGGAGGCG 2 5 79 

I II II II II II II II I II II I I I I I I I I I I I I I I II III I II II I II II I 
CGGACGCGCGCGTCTG-TGCCTGCTTGTGGATGATGCTGCTGATAGCTCAAGCTGAGGCC 2 5 79 

GCTTTGGAGAACCTCGTAATACTCAATGCAGCATCCCTGGCCGGGACGCACGGTC-TTGT 2 63 8 

II I II II II II II I I I I I I II I I I I I I I II II II I II II II I II I 
GCCCTAGAGAACCTGGTGGTCCTCAACGCGGCATCCGTGGCCGGGGCGCATGG-CATTCT 2 63 8 
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Query 


2639 


Sbjct 


2639 


Query 


2695 


Sbjct 


2695 


Query 


2753 


Sbjct 


2753 


Query 


2810 


Sbjct 


2809 


Query 


2864 


Sbjct 


2864 


Query 


2921 


Sbjct 


2921 


Query 


2980 


Sbjct 


2980 


Query 


3036 


Sbjct 


3036 


Query 


3094 


Sbjct 


3094 


Query 


3151 


Sbjct 


3151 


Query 


3209 


Sbjct 


3209 


Query 


3268 


Sbjct 


3268 


Query 


3327 


Sbjct 


3327 


Query 


3384 


Sbjct 


3384 


Query 


3443 


Sbjct 


3443 


Query 


3503 


Sbjct 


3503 


Query 


3562 


Sbjct 


3562 




3622 


Sbjct 


3621 


Query 


3681 


Sbjct 


3681 



GTCCTTCCTCGTGTTCTTCTGCTT-TGCGTGGTATC-TGAAGGGTAGG-TGGGTGCCC-G 269 4 

I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I III III I III I 

CTCCTTCCTCGTGTTCTTCTG-TGCTGCCTGGTA-CATCAAGGGCAGGCTGG-T-CCCTG 269 4 

GAGCGGTC-TACGCCCTCTACGG-GATGTGGCCTCTCCTCCTGCTCCTGCTGGCGTTGCC 2 752 
I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II 

GGGCGG-CATATGCCCTCTACGGCG-TATGGCCGCTACTCCTGCTCCTGCTGGCGTTACC 2 752 

TC-AGCGGGCATACGC-ACTGGACACGG-AGGTGGCCGCGTCGTGTGGCGGCGTTGTTCT 2 8 09 

I I II I I I I I I I I I I I I I I III II I I I I II I I I I I II I I I I III I 
ACCA-CGAGCATACGCCA-TGGAC-CGGGAGATGGCAGCATCGTGCGGAGGCGCGGTT-T 2 8 0 8 

T-GTCGGGT-TAATGGCGCT-GACTCT-GTCGCCATATTACAAGC-GCTATATCAGCT-G 2 863 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

TCGTAGG-TCTGATA-CTCTTGAC-CTTGTCACCGCACTATAAGCTGTTCC-TC-GCTAG 2 863 

G-TGCATGTGGTGGCTT-CAGTATTTTCTGACCAGAGTAGAAGCGCAACT-GCACGTGTG 2 92 0 
I I III I I I I I I II II I I I I I I I I I I I I I II II II II III I I I I I 

GCT-CATATGGTGG-TTACAATATTTTATCACCAGGGCCGAGGCACA-CTTGCAAGTGTG 292 0 

GGTTcccc c c.cTCAACGTCCo"'':;Cii;c;c; ;v5'CGCGATGCCGTCATCTTACTCATGTGTGT-AG 2 9 79 
I I I I I I I I I I I I I I I I MINIM I I I I I III I I 

GATCCCCCCCCTCAACGTTCGGGGGGGCCGCGATGCCGTCATCCTCCTCACGTGCGCGA- 2 9 79 

TACACCC-GACCCTGGTATTTGAC-ATCACCAAACTACTC-CTGGCCAT-CTTCGGACCC 3 035 

I I I I I I II I I I III II I I I I I I I I I I II II I I I I I II III II 
TCCACCCAGAGC-TAATCTTT-ACCATCACCAAAAT-CTTGCTCGCCATACT-CGGTCCA 3 035 

CTT-TGGATTCTTCAAGCCAGTTTG-CTTAAAGTCCCCTACTTCGTGCGCGTTCAAGGCC 3 093 

II I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I 
CTCATGG-TGCTCCAGGCTGGTATAACC-AAAGTGCCGTACTTCGTGCGCGCACACGGGC 3 093 

TTC-TCCG-G-ATCTGCGCGCTAGCGCGGAAGATAGCCGGAGGTCATTACGTGCAAATGG 3150 
I I I II I II II III I I I I I I I I I II II I I I I I I I I II I I I I I I I 

T-CATTCGTGCAT — GCATGCTGGTGCGGAAGGTTGCTGGGGGTCATTATGTCCAAATGG 3150 

C-CATCATCAAGTTAGGG-GCGCTTACTGGCACCTATGTGTATAACCATCTCACCCCTCT 32 0 8 
I I I I I I I I I I I II II II II II II II II III I I I I I I I I I I I I I II 

CTC-TCATGAAGTT-GGCCGCACTGACAGGTACGTACGTTTATGACCATCTCACCCCACT 32 0 8 

TCGAGACTGGGCGCACAACGG-CCTGCGAGATCTGGCCGTGGCTGTGGAACCAGTCGTCT 326 7 

II I I I I I I I I III III III I I I I I II II I I I I I II II II I I I I I I I 
GCGGGACTGGGCCCACG-CGGGCCTACGAGACCTTGCGGTGGCAGTTGAGCCCGTCGTCT 32 6 7 

TCTCCCGA-ATGGAGACCAAGCTCATCACGTGGGGGGCAGATACCGCCGCGTGCGGTGAC 332 6 
I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II III 

TCTCT-GATATGGAGACCAAGGTTATCACCTGGGGGGCAGACACCGCGGCGTGTGGGGAC 332 6 

ATCATCAACGGCTTGCCCGTCTCTGCCCGTAGGGGCCAGG-AGATAC-TGCTTGGG-CCA 33 83 
I I I I I I III I I I I I I I I I I I I I I I II I I I III I I I I I I I II III II 

ATCATCTTGGGCCTGCCCGTCTCCGCCCGCAGGGGG-AGGGAGATACAT-CT-GGGACCG 33 83 

GCCGACGGAATGGTCTC-CAAGGGGTGGAGGTTGCTGGCGCCCATCACGGCGTACGCCCA 3 4 42 
I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

GCAGACAGCCTTGAAGGGCA-GGGGTGGCGACTCCTCGCGCCTATTACGGCCTACTCCCA 3 4 42 

GCAGACGAGAGGCCTCCTAGGGTGTATAATCACCAGCCTGACTGGCCGGGACAAAAACCA 35 02 

I I I I I I I I I I I I I II II II II I I I I I I I I I I II I I I I I I I I I I I I I I I 
ACAGACGCGAGGCCTACTTGGCTGCATCATCACTAGCCTCACAGGCCGGGACAGGAACCA 35 02 

AGTGGAGGGTGAGGTCCA-GATCGTGTCAACTGCTACCCAAACCTTCCTGGCAACGTGCA 3561 

II I I I I I I I I I I I I I I I II II II II II III I I I I I I I I I II III 
GGTCGAGGGGGAGGTCCAAG-TGGTCTCCACCGCAACACAATCTTTCCTGGCGACCTGCG 3561 

TCAATGGGGTATGCTGGACTGTCTACCACGGGGCCGGAACGAGGACCATCGCATCACCCA 3621 
I I I I I I I II II I I I I I I I I I I I II II I I I I I I I I I I I I II I I I I 

TCAATGGCGTGTGTTGGACTGTCTATCATGGTGCCGGCTCAAAGACCCTTGCCGG-CCCA 362 0 

A-GGGTCCTGTCATCCAGATGTATACCAATGTGGACCAAGACCTTGTGGGCTGGCCCGCT 36 8 0 

I III II III III I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II 
AAGGGCCCAATCACCCAAATGTACACCAATGTGGACCAGGACCTCGTCGGCTGGCAAGCG 36 8 0 

CCTCAAGGTTCCCGCTCATTGACACCCTGTACCTGCGGCTCCTCGGACCTTTACCTGGTC 3 7 4 0 

II I II I II II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CCCCCCGGGGCGCGTTCCTTGACACCATGCACCTGCGGCAGCTCGGACCTTTACTTGGTC 3 7 4 0 
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3741 


Sbjct 


3741 


Query 


3801 


Sbjct 


3801 


Query 


3860 


Sbjct 


3860 


Query 


3919 


Sbjct 


3919 


Query 


3975 


Sbjct 


3975 


Query 


4034 


Sbjct 


4033 


Query 


4092 


Sbjct 


4092 


Query 


4150 


Sbjct 


4150 


Query 


4210 


Sbjct 


4209 


Query 


4269 


Sbjct 


4269 


Query 


4326 


Sbjct 


4326 


Query 


4386 


Sbjct 


4386 


Query 


4445 


Sbjct 


4445 


Query 


4505 


Sbjct 


4505 


Query 


4565 


Sbjct 


4564 


Query 


4623 


Sbjct 


4623 


Query 


4682 


Sbjct 


4682 




4742 


Sbjct 


4742 


Query 


4800 


Sbjct 


4799 



ACGAGGCACGCCGATGTCATTCCCGTGCGCCGGCGAGGTGATAGCAGGGGTAGCCTGCTT 3 8 0 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I II 
ACGAGGCATGCCGATGTCATTCCGGTGCGCCGGCGGGGCGACAGCAGGGGGAGCCTACTC 3 8 0 0 

TCGCCCC-GGCCCATTTCCTACTTGAAAGGCTCCTCGGGGGGTCCGCTGTTGTGCCCCGC 3 859 

II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I III I I I I I I I I 
TC-CCCCAGGCCCGTCTCCTACTTGAAGGGCTCTTCGGGCGGTCCACTGCTCTGCCCCTC 3 859 

GGGACACGCCGTGGGCCTATT-CAGGGCCGCGGTGTGCACCCGTGGAGTGGCTAAAGCGG 3918 

III I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I II II II II I I I I 
GGGGCACGCTGTGGGCATCTTTC-GGGCTGCCGTGTGCACCCGAGGGGTTGCGAAGGCGG 3918 

TGGACTTTAT-CCCTG T GG AG AAC C T AGGG AC AAC C A- T — GAGATCCCCGGTGTTCACG 39 7 4 
I I I I I I I I I III II III I II III I I I I I I I I I I I I I I I I I I I I I I 

TGGACTTTGTACCC-GTCGAGT-C-TATGGA-AACCACTATGCGGTCCCCGGTCTTCACG 39 7 4 

GACAACTCCTCTCCACCAGCAGTGCCCCAGAGC-TTCCAGGTGGCCCACCTGCATGCTCC 4 033 
I I I I I I I I II II II II II II I I I I I I I I I I I I I I I I I I I II II II II 

GACAACTCGTCCCCTCCGGCCGTACCGCAGA-CATTCCAGGTGGCCCATCTACACGC-CC 4 032 

C-ACCGGCAGCGGTAAGAGCACCAAGGTCCCGGCTGCGTACGCAGCCCA-GGGCTACAAG 4091 
I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III II III 

CTACTGGTAGCGGCAAGAGCACTAAGGTGCCGGCTGCGTATGCAGCCCAAGGG-TATAAG 4 091 

GTG-TTGGTGCTCAACCCCTCTGTTGCTGCAACGCTGGGCTTT-GGTGCTTACATGTCCA 4149 
III III I II I I I I I II II II II II II II III II II II I I I I I I 

GTGCTTG-TCCTGAACCCGTCCGTCGCCGCCACCCTAGG-TTTCGGGGCGTATATGTCTA 4149 

AGGCCCATGGGGTTGATCCTAATATCAGGACCGGGGTGAGAACAATTACCACTGGCAGCC 42 09 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II II II I I I I I II III 
AGGCACATGGTATCGACCCTAACATCAGAACCGGGGTAAGGACCATCACCACGGGT-GCC 42 0 8 

CC-ATCACGTACTCCACCTACGGCAAGTTCCTTGCCGACGGCGGGTGCTCAGGAGGTGCT 426 8 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II II II 
CCCATCACGTACTCCACCTATGGCAAGTTTCTTGCCGACGGTGGTTGCTCTGGGGGCGCC 426 8 

TATGACATAATAATTTGTGACGAGTGCCACTCCACGGA-T-G-CCACATCCATCTTGGGC 4325 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I III I I I I I 

TATGACATCATAATATGTGATGAGTGCCACTCAACTGACTCGACCAC-T — ATCCTGGGC 4325 

ATCGGCACTGTCCTTGACCAAGCAGAGACTGCGGGGGCGAGACTGGTTGTGCTCGCCACT 43 85 
I I I I I I I I I I I I I I I I I I I I I I I I I I II II III I I I I II I I I I I I I I I I I 

ATCGGCACAGTCCTGGACCAAGCGGAGACGGCTGGAGCGCGACTCGTCGTGCTCGCCACC 43 85 

GCTACCCCTCCGGGCTCCGTCACTGTGTCC-CATCCTAACATCGAGGAGGTTGCTCTGTC 4 4 4 4 

I I I I I I I I I I I I I II I I I I I III II II I I I I I I I I I I I I I I I I I I I I I I I I I 
GCTACGCCTCCGGGATCGGTCACCGTG-CCACATCCAAACATCGAGGAGGTGGCTCTGTC 4 4 4 4 

CACCACCGGAGAGATCCCCTTTTACGGCAAGGCTATCCCCCTCGAGGTGATCAAGGGGGG 45 0 4 

II III I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
CAGCACTGGAGAAATCCCCTTTTATGGCAAAGCCATCCCCATCGAGACCATCAAGGGGGG 45 0 4 

AAGACATCTCATCTTCTGCCACTCAAAGAAGAAGTGCGACGAGCTCGCCGCGAAGCTGGT 456 4 

II II I I I I I I I I I I I I I II I I I I I I I I II II I I I I I I I I I I I I I I I I I I I 

GAGGCACCTCATTTTCTGCCATTCCAAGAAGAAATGTGATGAGCTCGCCGCGAAGCTG-T 4563 

C-G-CATTGGGCATCAATGCCGTGGCCTACTACCGCGGTCTTGACGTGTCTGTCATCCCG 462 2 

I I I I II I I I I I I I I II II II II I I I II I I I I I II II I I I I I II 
CCGGCCTCGGAC-TCAATGCTGTAGCATATTACCGGGGCCTTGATGTATCCGTCATACCA 462 2 

ACCAGCGGCGATGTTGTCGTCGT-GTCGACCGATGCTCTCATGACTGGCTTTACCGGCGA 46 81 

II I I I I I II II I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I 
ACTAGCGGAGACGTCATTGTCGTAG-CAACGGACGCTCTAATGACGGGCTTTACCGGCGA 46 81 

CTTCGACTCTGTGATAGACTGCAACACGTGTGTCACTCAGACAGTCGATTTCAGCCTTGA 4 7 41 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
TTTCGACTCAGTGATCGACTGCAATACATGTGTCACCCAGACAGTCGACTTCAGCCTGGA 4 7 41 

CCCTACCTTTACCATTGAGACAACCAC-GCTCCCCCAGGATGCTGTCTCCAGGACTCA-A 4 799 

III I I I I I I I I I I I I I I I I II II I I II II II II II II I I III I 
CCCGACCTTCACCATTGAGACGACGACCG-TGCCACAAGACGCGGTGTC-ACG-CTCGCA 4 79 8 

-CGCCGGGGCAGGACTGGCAGGGG 4 822 

II II I I I I I I I I I I I I I I I I 
GCGGCGAGGCAGGACTGGTAGGGG 4 8 22 
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